檢索結果:共39筆資料 檢索策略: "Hsin-Min Wang".ecommittee (精準) and cdept.raw="資訊工程系"
個人化服務 :
排序:
每頁筆數:
已勾選0筆資料
1
本論文研究多頻帶聲學迴音消除的方法,並且製作成軟體模組,然後把先人的雜訊刪減模組及我們的迴音消除模組整合到Linphone網路電話軟體裡,用以提升網路電話的語音品質。關於多頻帶迴音消除的方法,我們基…
2
本論文研究了階層式及分類器混合這兩種複合式的分類器結構,用於提升音樂曲風分類之正確率。首先我們對輸入的樂曲分析出四種頻域特徵,分別是梅爾頻譜,梅爾倒頻譜,調變頻譜及打擊音效頻譜,作為基礎聲學特徵;然…
3
本論文介紹了多個膾炙人口的端到端語音辨識模型,從一開始出現的Connectionist Temporal Classification(CTC)模型、Recurrent Neural Network…
4
近年來,多語言問答已經成為一項新興的研究議題,並引起了廣泛的關注。仰賴於各種基於深度學習的先進技術,面向英文及其他資源豐富的語言所開發的系統有著高度的發展,但面向資源匱乏的語言時,這些技術大多因為資…
5
本論文研究了歌聲表情參數的分析,再應用音節單元選擇的方法及HNM(Harmonic plus Noise Model)信號合成的方法,來建立一個可以模仿真人表情的國語歌聲合成系統。我們重新錄製了國語…
6
自動語音辨識模型(Automatic speech recognition, ASR)的目的是將語音訊號轉換為對應的文字,其對聲學的特徵和文字的前後文意有著很強的學習能力才能夠整合語音與文字兩個模態…
7
本論文針對國語雙字詞發音,發展可行的聲調評分方法,評分的處理分為兩個階段,第一階段作基週軌跡分析、音長和音高的正規化,以擷取出特徵參數,第二階段為評分模式,我們研究了類神經網路(ANN)模式以及統計…
8
基於 Transformer 的模型在各大研究領域中都帶來了重大的創新,例如:語音訊號處理、自然語言處理和計算機視覺等。在 Transformer 被提出之後,基於注意力機制的端到端自動語音識別模型…
9
本論文的目標在於分辨輸入的聲音片段屬於歌唱聲(含有歌聲)或是樂器聲(不含歌聲),研究焦點放於組合不同種類之特徵係數以找出最具有識別效果之特徵向量,在此採用的特徵係數包括梅爾倒頻譜係數、基週偵測特徵係…
10
本論文提出一種結合類神經網路(ANN)、全域變異數(GV)調整與真實基週軌跡挑選之音節基週軌跡產生方法,可用以改善ANN產生之基週軌跡過度平滑的現象,並且可提升合成語音音調的自然度。在模型訓練階段,…